期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 融合边特征与注意力的表格结构识别模型
吕学强, 张煜楠, 韩晶, 崔运鹏, 李欢
《计算机应用》唯一官方网站    2023, 43 (3): 752-758.   DOI: 10.11772/j.issn.1001-9081.2022010053
摘要333)   HTML12)    PDF (2113KB)(199)    收藏

针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测。在SciTSR-COMP数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR的召回率与F1值分别提升2.5与1.4个百分点。在消融实验中,GEAN-TSR采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性。实验结果表明,GEAN-TSR能够有效提升网络性能,更好地完成表格结构识别任务。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 融合BERT与标签语义注意力的文本多标签分类方法
吕学强, 彭郴, 张乐, 董志安, 游新冬
《计算机应用》唯一官方网站    2022, 42 (1): 57-63.   DOI: 10.11772/j.issn.1001-9081.2021020366
摘要1408)   HTML72)    PDF (577KB)(1235)    收藏

多标签文本分类(MLTC)是自然语言处理(NLP)领域的重要子课题之一。针对多个标签之间存在复杂关联性的问题,提出了一种融合BERT与标签语义注意力的MLTC方法TLA-BERT。首先,通过对自编码预训练模型进行微调,从而学习输入文本的上下文向量表示;然后,使用长短期记忆(LSTM)神经网络将标签进行单独编码;最后,利用注意力机制显性突出文本对每个标签的贡献,以预测多标签序列。实验结果表明,与基于序列生成模型(SGM)算法相比,所提出的方法在AAPD与RCV1-v2公开数据集上,F1值分别提高了2.8个百分点与1.5个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于快速鲁棒特征集合统计特征的图像分类方法
王澍, 吕学强, 张凯, 李卓
计算机应用    2015, 35 (1): 224-230.   DOI: 10.11772/j.issn.1001-9081.2015.01.0224
摘要527)      PDF (1151KB)(19376)    收藏

针对现有利用快速鲁棒特征(SURF)进行图像分类的方法中存在的效率低、正确率低的问题,提出一种利用图像SURF集合的统计特征进行图像分类的方法.该方法将SURF的各个维度及尺度信息视为各自独立的随机变量,并利用拉普拉斯响应区分不同数据.首先,获取图像的SURF向量集合;然后,分维度计算SURF向量集合的一阶中心绝对矩、带权一阶中心绝对矩等统计特征,并构建特征向量;最后,结合支持向量机(SVM)进行图像分类.在Corel 1K图像库上的实验结果表明,该方法查准率较SURF直方图方法和三通道Gabor纹理特征方法分别提高17.6%和5.4%.通过与HSV直方图特征进行高级特征融合,可获得良好的分类性能.与SURF直方图结合HSV直方图方法、三通道Gabor纹理特征结合HSV直方图方法、基于视觉词袋(BoVW)模型的多示例学习方法相比,查准率分别提高了5.2%,6.8%,3.2%.

参考文献 | 相关文章 | 多维度评价
4. 融合词义信息的中文短语句法分析
耿立飞 李红莲 吕学强 吴云芳
计算机应用    2014, 34 (4): 1109-1113.   DOI: 10.11772/j.issn.1001-9081.2014.04.1109
摘要356)      PDF (901KB)(376)    收藏

针对目前融合词义信息的短语句法分析过程中,多义词词义消歧较差的问题,提出一种基于词性消歧的中文短语句法分析方法。首先构建具有词性信息的同义词字典;然后对训练集和测试集中的词语进行词义替换,利用多义词的词性区分其不同的词义。在宾州中文树库(CTB)的实验结果表明,正确率为80.30%,召回率为78.12%,F值为79.19%。相对于没有进行词性消歧的系统,该方法有效提高了短语句法分析的性能。

参考文献 | 相关文章 | 多维度评价
5. 基于突发词聚类的微博突发事件检测方法
郭跇秀 吕学强 李卓
计算机应用    2014, 34 (2): 486-490.  
摘要505)      PDF (951KB)(761)    收藏
微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注。分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入凝聚式层次聚类算法,对突发词集进行聚类,并筛选出合适的突发词类簇用以描述突发事件,从而实现微博突发事件检测。通过实验检测,结果是正确率为63.64%,召回率为87.5%,F值为0.74,表明该方法可以在大量微博数据中有效检测到突发事件。
相关文章 | 多维度评价
6. 基于加权距离的机械设计图像异步检索方法
方乃伟 吕学强 张丹 王弘蔚
计算机应用    2013, 33 (05): 1406-1410.   DOI: 10.3724/SP.J.1087.2013.01406
摘要658)      PDF (807KB)(594)    收藏
根据机械设计图像的形状特征,提出一种利用加权距离实现的多特征异步检索方法。首先利用机械设计图像的外接圆距离特征进行初步检索,再结合初步检索结果集的位置计算输入图像和初步检索结果集的加权Hu不变矩特征距离,并据此获得最终的检索结果。实验表明,与单一特征的检索方法相比,该方法在机械设计图像检索中有更高的查准率和查全率。
参考文献 | 相关文章 | 多维度评价
7. 基于扩展射线法的三维模型检索
姜阳 吕学强 李琳 施水才
计算机应用    2013, 33 (02): 463-467.   DOI: 10.3724/SP.J.1087.2013.00463
摘要686)      PDF (782KB)(350)    收藏
针对原始射线法特征提取时间较长、仅利用三角形面片问题,提出一种基于不相交平面束原理的扩展射线法。从质心均匀散射出一组射线与三角形面片相交,利用射线确定的不相交平面束定位交点;根据交点、顶点到质心的距离,建立检索模型以改善三维模型的检索效果。利用普林斯顿大学三维模型库的10类模型作为实验数据,实验结果表明:与原始射线法对比,扩展射线法不仅提高了特征提取速度,而且提高了检索准确率。
相关文章 | 多维度评价
8. 面向煤矿机电设备领域的三元组抽取方法
游新冬 问英姿 佘鑫鹏 吕学强
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023070943
预出版日期: 2023-10-26